Source | # of sentences | Average logarithmic rank |
---|---|---|
http://hy.wikipedia.org/wiki/Գերբնականը_հեռուստասերիալի_կերպարների_ցանկ | 17 | 6.06 |
http://hy.wikipedia.org/wiki/Ստամբուլ | 14 | 6.24 |
http://hy.wikipedia.org/wiki/Չարլի_Չապլին | 11 | 6.29 |
http://hy.wikipedia.org/wiki/Արջամկան_օրը_(ֆիլմ) | 13 | 6.45 |
http://hy.wikipedia.org/wiki/Հիսուս | 13 | 6.46 |
http://hy.wikipedia.org/wiki/Հույզեր | 15 | 6.46 |
http://hy.wikipedia.org/wiki/«Նարուտո»_կերպարների_ցանկ | 22 | 6.48 |
http://hy.wikipedia.org/wiki/Մայք_Թայսոն | 14 | 6.49 |
http://hy.wikipedia.org/wiki/Դիեգո_Մարադոնա | 18 | 6.54 |
http://hy.wikipedia.org/wiki/Նապոլեոն_Բոնապարտ | 11 | 6.54 |
http://hy.wikipedia.org/wiki/Էմմիլու_Հարրիս | 11 | 6.55 |
http://hy.wikipedia.org/wiki/Նոր_Զելանդիա | 12 | 6.55 |
http://hy.wikipedia.org/wiki/Պիտեր_Պաուլ_Ռուբենս | 14 | 6.60 |
http://hy.wikipedia.org/wiki/Կեսարի_քաղաքացիական_պատերազմ | 11 | 6.71 |
http://hy.wikipedia.org/wiki/Ջեյմս_Ջոյս | 11 | 6.74 |
http://hy.wikipedia.org/wiki/Հաննիբալ | 11 | 6.78 |
http://hy.wikipedia.org/wiki/Վլադիմիր_Վիսոցկի | 13 | 6.84 |
http://hy.wikipedia.org/wiki/Հուլիոս_Կեսար | 16 | 6.86 |
http://hy.wikipedia.org/wiki/Կյանքի_ճանապարհ | 14 | 6.87 |
http://hy.wikipedia.org/wiki/Էռնան_Կորտես | 12 | 6.91 |
http://hy.wikipedia.org/wiki/Հին_Եգիպտոս | 11 | 6.93 |
http://hy.wikipedia.org/wiki/Իսլամ | 12 | 6.94 |
http://hy.wikipedia.org/wiki/Եվրամայդանի_ժամանակագրություն | 11 | 6.95 |
http://hy.wikipedia.org/wiki/Առաջին_համաշխարհային_պատերազմ | 11 | 6.96 |
http://hy.wikipedia.org/wiki/Մաքսիմ_Գորկի | 12 | 6.96 |
http://hy.wikipedia.org/wiki/COVID-19_համավարակը_Ռուսաստանում | 11 | 7.03 |
http://hy.wikipedia.org/wiki/Հովարդ_Ռոբարդ_Հյուզ_Կրտսեր | 15 | 7.04 |
http://hy.wikipedia.org/wiki/Օրգանական_միացություններ | 12 | 7.05 |
http://hy.wikipedia.org/wiki/Տիտանիկի_խորտակում | 19 | 7.21 |
http://hy.wikipedia.org/wiki/Ստալինյան_բռնաճնշումներ | 12 | 7.27 |
Source | # of sentences | Average logarithmic rank |
---|---|---|
http://hy.wikipedia.org/wiki/Իսպանական_ժառանգության_համար_պատերազմ | 11 | 7.35 |
http://hy.wikipedia.org/wiki/Իտալական_գրականություն | 16 | 7.32 |
http://hy.wikipedia.org/wiki/Ստալինյան_բռնաճնշումներ | 12 | 7.27 |
http://hy.wikipedia.org/wiki/Տիտանիկի_խորտակում | 19 | 7.21 |
http://hy.wikipedia.org/wiki/Օրգանական_միացություններ | 12 | 7.05 |
http://hy.wikipedia.org/wiki/Հովարդ_Ռոբարդ_Հյուզ_Կրտսեր | 15 | 7.04 |
http://hy.wikipedia.org/wiki/COVID-19_համավարակը_Ռուսաստանում | 11 | 7.03 |
http://hy.wikipedia.org/wiki/Առաջին_համաշխարհային_պատերազմ | 11 | 6.96 |
http://hy.wikipedia.org/wiki/Մաքսիմ_Գորկի | 12 | 6.96 |
http://hy.wikipedia.org/wiki/Եվրամայդանի_ժամանակագրություն | 11 | 6.95 |
http://hy.wikipedia.org/wiki/Իսլամ | 12 | 6.94 |
http://hy.wikipedia.org/wiki/Հին_Եգիպտոս | 11 | 6.93 |
http://hy.wikipedia.org/wiki/Էռնան_Կորտես | 12 | 6.91 |
http://hy.wikipedia.org/wiki/Կյանքի_ճանապարհ | 14 | 6.87 |
http://hy.wikipedia.org/wiki/Հուլիոս_Կեսար | 16 | 6.86 |
http://hy.wikipedia.org/wiki/Վլադիմիր_Վիսոցկի | 13 | 6.84 |
http://hy.wikipedia.org/wiki/Հաննիբալ | 11 | 6.78 |
http://hy.wikipedia.org/wiki/Ջեյմս_Ջոյս | 11 | 6.74 |
http://hy.wikipedia.org/wiki/Կեսարի_քաղաքացիական_պատերազմ | 11 | 6.71 |
http://hy.wikipedia.org/wiki/Պիտեր_Պաուլ_Ռուբենս | 14 | 6.60 |
http://hy.wikipedia.org/wiki/Էմմիլու_Հարրիս | 11 | 6.55 |
http://hy.wikipedia.org/wiki/Նոր_Զելանդիա | 12 | 6.55 |
http://hy.wikipedia.org/wiki/Դիեգո_Մարադոնա | 18 | 6.54 |
http://hy.wikipedia.org/wiki/Նապոլեոն_Բոնապարտ | 11 | 6.54 |
http://hy.wikipedia.org/wiki/Մայք_Թայսոն | 14 | 6.49 |
http://hy.wikipedia.org/wiki/«Նարուտո»_կերպարների_ցանկ | 22 | 6.48 |
http://hy.wikipedia.org/wiki/Հիսուս | 13 | 6.46 |
http://hy.wikipedia.org/wiki/Հույզեր | 15 | 6.46 |
http://hy.wikipedia.org/wiki/Արջամկան_օրը_(ֆիլմ) | 13 | 6.45 |
http://hy.wikipedia.org/wiki/Չարլի_Չապլին | 11 | 6.29 |
In this subsection we replace average word length by average logarithmic word rank. The logarithm of the word rank is taken because we want to punish words of high ranks only moderately.
First table:
select source, count(distinct i_s.s_id) as cnt_s, round(avg(log(w.w_id-100)),2) as av from sources so, inv_so i_s, inv_w i, words w where so.so_id=i_s.so_id and i_s.s_id=i.s_id and i.w_id=w.w_id and w.w_id>100 group by source having cnt_s>10 order by av LIMIT 30;
6.4.2.1 Average word length for different sources
6.4.2.3 Sources consisting of many / few words with frequency 1
6.4.2.4 Sources with low / high average word length of rare words